Конечно, пока что мы обработали наши данные, поэтому на этом этапе узнать о
влиянии региона на температуру точно нельзя, но мне кажется, что эти зависимости
хоть и будут присутствовать, но не так сильно, как если бы мы мерили датчики в той же
России. Зато по карте отлично видно, что:
1. Средняя температура зависит от количество солнечных часов
2. Средняя скорость ветра сильно зависит от появлений максимальной скорости
ветра.
3. Температурные данные сильно коррелируют, лучше использовать только одно
значение Tavg
4. На удивление, средняя температура воздуха не слабо зависит от скорости ветра.
Это может обозначать только то, что на их широте относительно стабильные
ветра, да и цунами в таких областях, скорее всего, редко возникают.
5. Чем больше влажность воздуха, тем меньше вредняя скорость воздуха (что?). Могу
только предположить, что это просто тропики, поэтому там поддерживается
постоянная влажность из-за окружения морями со всех сторон (или возможно
просто я глупый)
df_edited=df.drop(["station_id", "Tn", "Tx","ff_x","ddd_x","ddd_car", "date"],
axis=1)
print('Значения таблицы в изначальном датасете:\n',df.columns.values)
print('\nРазмер таблицы в изначальном датасете:',df.shape)
print('\nЗначения таблицы в датасете dummy:\n',df_edited.columns.values)
print('\nРазмер таблицы в измененном датасете:',df_edited.shape)